Microsoft bringt neue KI für Diagnosen auf den Markt: „Bis zu 4x besser als Ärzte“

Microsoft hat heute Forschungsergebnisse vorgestellt, die einen Wendepunkt in der Beziehung zwischen künstlicher Intelligenz und Medizin markieren könnten.
Ein Projekt der KI-Arbeitsgruppe um Mustafa Suleyman hat die Fähigkeit bewiesen, 85 % der im New England Journal of Medicine (einer der renommiertesten medizinischen Fachzeitschriften der Welt) veröffentlichten klinischen Fälle korrekt zu diagnostizieren. Dies übertreffe die Genauigkeitsrate einer Gruppe von Fachärzten um mehr als das Vierfache, heißt es.
„Das KI-Team von Microsoft stellt Forschungsergebnisse vor, die zeigen, wie KI die komplexesten diagnostischen Herausforderungen in der Medizin sequenziell untersuchen und lösen kann“, heißt es in einem auf der offiziellen Microsoft-Website veröffentlichten Artikel, „Fälle, die selbst erfahrenen Ärzten schwerfallen.“
Die neue Grenze der sequentiellen DiagnoseDer Kern der Innovation von MAI-DxO (so heißt das Programm) liegt in seiner Fähigkeit, klinisches Denken Schritt für Schritt nachzubilden. Genau so, wie es ein Arzt in der Praxis tun würde. Es geht nicht darum, Multiple-Choice-Fragen zu beantworten, sondern einen echten Diagnoseprozess zu durchlaufen, ausgehend von den Symptomen, über das Stellen spezifischer Fragen, das Anordnen von Tests und die Auswertung der Ergebnisse. Mehr als eine einzelne Analyse, eine einigermaßen genaue Nachbildung des klinischen Denkens.
„Bei Microsoft AI arbeiten wir daran, die Fähigkeiten zum klinischen Denken zu verbessern und zu bewerten. Um die Grenzen von Multiple-Choice-Tests zu überwinden, haben wir uns auf die sequentielle Diagnose konzentriert, die die Grundlage für medizinische Entscheidungen in der realen Welt bildet“, heißt es auf der Seite mit den Forschungsergebnissen weiter.
Ein konkretes Beispiel aus der Studie: Laut den Forschern könnte ein Patient mit Husten und Fieber das System dazu veranlassen, zunächst Bluttests und anschließend eine Röntgenaufnahme des Brustkorbs anzufordern, bevor es die korrekte Diagnose einer Lungenentzündung stellt – genau wie ein Arzt.
KI vs. Ärzte: Software schlägt menschliches Team um 85 % zu 20 %Das Team verwendete 304 reale klinische Fälle aus der wöchentlichen Case Records- Reihe des NEJM und wandelte sie in einen Benchmark namens SD Bench (Sequential Diagnosis Benchmark) um. Die Leistung von MAI-DxO, das große Sprachmodelle wie OpenAI o3, Gemini, Claude, Grok und andere koordiniert, überraschte die Forscher. Sie schrieben: „Der Vergleich der Ergebnisse mit realen Fällen, die wöchentlich im New England Journal of Medicine veröffentlicht werden, zeigt, dass der Microsoft AI Diagnostic Orchestrator (MAI-DxO) bis zu 85 % der Fälle korrekt diagnostiziert – mehr als viermal so häufig wie ein Expertengremium aus Klinikern.“
Die 21 an der Evaluierung beteiligten Ärzte aus den USA und Großbritannien stellten im Durchschnitt 20 % der Diagnosen richtig. Microsofts System erwies sich zudem als kostengünstiger, da gezieltere und weniger invasive Tests zum Einsatz kamen. „MAI-DxO kommt günstiger zur richtigen Diagnose als Ärzte“, fügen sie hinzu.
Kein Ersatz für den Menschen, sondern eine ErweiterungMicrosoft betonte ausdrücklich, dass MAI-DxO nicht dazu gedacht sei, Ärzte zu ersetzen, sondern sie in den schwierigsten Fällen oder bei mangelndem Zugang zu Spezialisten zu unterstützen.
„Die Rolle der Ärzte geht weit über die bloße Diagnose hinaus. Sie müssen in der Lage sein, mit unklaren Situationen umzugehen und Vertrauen zu Patienten und ihren Familien aufzubauen. Dazu ist KI heute nicht in der Lage“, heißt es weiter.
Das Unternehmen räumt zwar ein, dass das System noch nicht für den klinischen Einsatz bereit sei, glaubt jedoch, dass es in Zukunft den Zugang zur Versorgung verbessern, Fehler reduzieren und in besonders komplexen Situationen helfen könnte.
Auf dem Weg zur medizinischen „Superintelligenz“Microsoft hat den Weg dahin mit dem Begriff „Path to Medical Superintelligence“ definiert. Das Ziel: eine KI, die den menschlichen Fähigkeiten in der medizinischen Diagnose, Behandlung und Vorhersage nicht nur ebenbürtig, sondern sogar überlegen ist.
In der Studie heißt es: „Diese und darüber hinausgehende Denkprozesse könnten das Gesundheitssystem grundlegend verändern. KI könnte Patienten helfen, einfache Aspekte ihrer Gesundheit selbstständig zu managen und Ärzten bei komplexeren Fällen erweiterte Unterstützung bieten.“
Microsoft kündigte an, den Benchmark für wissenschaftliche Zusammenarbeit und Verifizierung öffentlich zugänglich zu machen. Zukünftige Tests werden sich auf häufigere Symptome konzentrieren, um die Zuverlässigkeit in alltäglichen Situationen zu bestätigen.
Das Projekt kommt zu einem Zeitpunkt, an dem die weltweiten Gesundheitsausgaben rasant steigen. In den USA übersteigen die Kosten – so erinnert der Guardian – 20 Prozent des BIP, und bis zu einem Viertel der Ausgaben gelten als ineffizient.
repubblica